# -- coding: utf-8 --
# @Time : 2021/3/11--20:08
# @Author : ChinaV
# @File : 简单应用题 2：分词去重.py

'''
模板
# 请在...处使用多行代码替换
#
# 注意：其他已给出代码仅作为提示，可以修改

...  #此处可多行
#对数据进行中文分词处理
import jieba
f = open('out1.txt','w')
fi = open("data.txt","r",encoding="utf-8")
......
fi.close()
f.close()
'''

# 答案
import jieba

f = open('out1.txt', 'w')
fi = open("data.txt", "r", encoding="utf-8")
txt = jieba.lcut(fi.read())
txt = list(set(txt))
txt.sort()
for i in txt:
    if len(i) >= 3:
        f.write(i + '\n')
fi.close()
f.close()

